使用 nodeJs 实现 js/ts 文件翻译功能 您所在的位置:网站首页 google 翻译插件 js 使用 nodeJs 实现 js/ts 文件翻译功能

使用 nodeJs 实现 js/ts 文件翻译功能

2023-10-11 06:42| 来源: 网络整理| 查看: 265

使用 nodeJs 实现 js/ts 文件翻译功能 一、搭建环境二、读文件三、列出文中的所有中文内容四、替换中文五、实现翻译功能

关于实现翻译(已中翻英为例)的功能,我们可以分成几个步骤:

读文件找出文中的中文将文中的出现的中文词组或者句子组成一哥数组调用公共的翻译接口进行异步翻译将翻译出来的英文回填会文件中 一、搭建环境

打开终端,键入:node -v

如果出现 -bash: node: command not found

说明 node 的环境没有搭建。请到官网上下载。

如果终端上出现:v10.16.0 类似这样的版本号,说明你的 node 环境搭建好啦。

二、读文件

我们先读取固定的文件,后面我们会尝试实现翻译上传的文件,有需要的小伙伴可以移步到后面的内容。

首先我们在文件夹下创建一个 replace.js 文件用来编写我们的代码。

其次创建一个供我们翻译的 js/ts 文件,如:DesUtils.ts,代码如下:

const desKeyObj = { desKey: 'ztesoftbasemobile20160812..', ivKey: '01234567890' } export default { /** * 加密 * @param dataStr */ encrypt: function (dataStr) { try { console.log("如果这是一段话。并且还有标点符号。"); } catch (error) { console.log('加密报错' + JSON.stringify(error)); } }, /** * * @param dataStr 解密 */ crypto: function (dataStr) { try { console.log(''); } catch (error) { console.log('解密报错') } } }

现在我们开始编写 replace.js 文件,来读取 DesUtil.ts 文件。

首先我们可以使用 require 命令来引入我们需要的模块。

var fs = require('fs');

node 对于文件的读写操作是基于 Stream 流的形式。

fs 模块下有四种流类型:

Readable - 可读操作Writable - 可写操作Duplex - 可读可写操作Transform - 操作被写入数据,然后读出结果

对于流的操作也有四种:

data - 当有数据可读时触发end - 没有更多的数据可读时触发error - 在接收和写入过程中发生错误时触发finish - 所有数据已被写入到底层系统时触发

是不是看了有点懵呢,不着急,通过下面的代码你就能理解。

创建可读流,并处理流事件:

// 创建可读流 let readerStream = fs.createReadStream('DesUtils.ts'); readerStream.setEncoding('UTF8'); let data = ''; // 处理流 readerStream.on('data', (chunk) => { data += chunk; }); readerStream.on('end',() => { console.log(data); }); // 可不写 readerStream.on('error', (err) => { console.log(err.stack); });

在这里插入图片描述

读文件的代码我们已经写完了,现在我们尝试运行一下:

终端进入到该文件夹下,键入:node replace.js, 不出意外的话文件的内容已经完整的展示在终端上了。

三、列出文中的所有中文内容

在 data 上进行数据的处理,我们要通过正则表达式将文中的中文取出来。在上面的代码上进行修改:

readerStream.on('data', (chunk) => { const reg = /[\u4e00-\u9fa5]/g; while(list = reg.exec(chunk)) { console.log(list[0]); } })

在这里插入图片描述

好了现在我们已经把所有的中文全部取出来了,如果我们的需求是删除中文的话,我们只需要将这些中文删除即可。

如果是翻译成英文的话,总不能一个字一个字的翻译吧?

所以需要我们将这个中文分类出来,该是词组的就存成词组,该是句子的就存成句子,用一个数组来进行存放。

我的方式是通过每个字的索引进行判断。获取到中文与前一个中文索引相比是否是相邻关系,如果是,就不能拆开来,应该组成一个词语或者句子进行存储(可能小伙伴看不懂,你们直接分析代码吧~)

如果有更优的方法,小伙伴可以自己尝试哈~

readerStream.on('data', (chunk) => { var reg = /[\u4e00-\u9fa5]/g; let index = 0; let termList = []; // 遍历获取到的中文数组 let term = ''; data = chunk; while (list = reg.exec(chunk)) { if ((list.index !== index + 1) && term) { termList.push(term); term = ''; } term += list[0]; index = list.index; } termList.push(term); console.log(termList); // 打印中文数据 })

在这里插入图片描述

通过上面的代码,我们就已经把词组,句子等区分出来了。终端上就能看到数据 [ '加密', '如果这是一段话', '并且还有标点符号', '加密报错', '解密', '解密报错' ]。

翻译的功能我们放到下个模块去说,我们现在先把获取到的中文内容替换成随意的内容。

四、替换中文

创建一个可以写入的流,将查询出来的中文替换成随便的字符。

// 创建一个可以写入的流,写入到文件 replaceDesUtils.ts 中 let writerStream = fs.createWriteStream('replaceDesUtils.ts'); readerStream.on('data', (chunk) => { var reg = /[\u4e00-\u9fa5]/g; let index = 0; let termList = []; // 遍历获取到的中文数组 let term = ''; while (list = reg.exec(chunk)) { ...省略 } if(termList && termList.length) { termList.map(item => { data = data.replace(item, '112233'); // 至此,已经将中文全部进行替换 }) } writerStream.end(data); // 将替换后的文件写入到 replaceDesUtils.ts 中去 })

现在就可以发现当前包下多了一个 replaceDesUtils.ts 文件,快打开看看是否成功了吧。

五、实现翻译功能

在调用翻译的接口上,参考了基于nodejs实现一个有道词典翻译器 百度上的一个教程文档,小伙伴们可以做参考。

我粗略说下创建的步骤(里头有50元的额度,够我们写 demo 测试用就是了~):

打开有道智云注册下账号登录后在左边的 tab 上找到 自然语言翻译-翻译实例,创建新的实例,选择文本翻译(或者你可以选择其他的类型,我只尝试了文本翻译)打开左边 tab 上应用管理-我的应用,创建新的应用,接入类型 选择 API, 点击下一步后绑定刚创建的实例。查看应用详情里就有 应用ID 和 应用密钥 这两个字段,分别对应一会需要用到的 appKey 和 secretKey.

在这里插入图片描述

接下来在该文件夹下创建一个 translator.js 文件,直接 copy 基于nodejs实现一个有道词典翻译器这里的代码就行。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-jQSSvVM7-1578552563377)(gitImg/nodeReplace/1-5.jpg)]

但是这个文件有一些需要用到的库我们没有。需要我们手动安装一下,步骤如下:

1、在当前包下创建一个 package.json 文件,复制一下的代码: { "dependencies": { "request": "^2.88.0", "request-promise": "^4.2.5" } } 2、然后在终端上执行:npm i 或者 yarn,装上我们需要的库。

好了继续在 replace.js 编写我们的代码:

引入翻译的文件,并实例化设置翻译的配置编写公共方法,进行翻译(小伙伴如果对 Promise 不太理解我下文有解释啊哈~)将中文进行翻译并写入文档中 var Translator = require('./translator'); let translator = new Translator(); translator.config = { from: 'zh_CHS', to: 'EN', appKey: '*********', secretKey: '****************' } function translateString(str) { return new Promise(function (resolve, reject) { let resultStr = translator.translate(str); resolve(resultStr); }) }

这里先解释一下 translateString() 这个方法,因为我们调用的翻译接口是异步的,如果不使用 Promise 会存在延迟问题。

Promise 提供了一种异步执行模式。

其提供的两个参数可以理解为 return, 通过 resolve 将需要的数据传递出去。这里我们来个小小的测试

translateString('加油').then(val => { console.log(val); })

在这里插入图片描述

出来的数据是一大长串 JSON 字符串,我们对此进行转义和截取下。console.log(JSON.parse(val).translation)

是不是发现翻译后的内容已经被我们获取到了。

现在我们继续来编写代码:

while (list = reg.exec(chunk)) { ...省略 } termList.push(term); console.log(termList); // 打印中文数据 translateString(termList).then(val => { let translation = JSON.parse(val).translation; // 这里可以打印一下数据,翻译出来的内容,就可以知道为什么下文的代码要那样写了。 let transList = []; // 翻译后的数组 if(translation[0] && translation[0].indexOf(',') !== -1) { transList = translation[0].split(', '); // 逗号后面有个空格不要漏了哈 transList.map((item, index) => { console.log(termList[index], item); const res = data.replace(termList[index], item); data = res; }) writerStream.write(data, 'UTF8'); writerStream.end(); console.log('写入完成'); } })

在这里插入图片描述 在这里插入图片描述

好了小伙伴们,现在我们打开 replaceDesUtils.ts 看看效果哈。

后面的文章会用到 express 进行文本操作,可以上传自定义的文件进行翻译。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有